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摘 要 : 基于 多 分 辩 分 析 的 小 波 分 析 通 过 检测 小 波 系数 的 绝对 值 来 检测 数据 中 的 变 点 。 本 文 利用 小 波 方法 
和 极限 定理 对 噪声 为 单位 根 过 程 的 非 参数 回归 模型 均值 变 点 进行 检测 。 在 原 假 设 成 立 的 条 件 下 得 
到 任意 尺度 上 检验 的 临界 值 ， 证 明 检验 的 一 致 性 ， 并 且 给 出 小 波 系 数 的 阐 值 。 在 备 择 假设 成 立 的 
条 件 下 ， 给 出 变 点 个 数 、 变 点 位 置 的 相合 估计 与 收敛 速度 。 最 后 利用 模拟 研究 说 明了 方法 的 有 效 
性 和 实用 性 。 
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变 点 是 用 来 描述 函数 或 信号 的 突然 局 部 变化 ， 在 故障 诊断 、 金 融 、 医 学 等 方面 都 有 大 量 的 
应 用 [3， 如 故障 信号 的 识别 、 汇 率 变 点 的 研究 、 心 电 图 中 的 心律 检测 等 。 变 点 分 析 本 质 上 属 
于 数理 统计 和 非 线性 时 间 序列 范畴 ， 它 引起 了 国内 外 众多 学 者 的 关注 B 和 。 

非 线 性 时 间 序 列 可 分 为 平稳 时 间 序 列 和 非 平 稳 时 间 序 列 两 类 ， 实 际 问题 中 很 多 数据 都 属于 
非 平稳 时 间 序列 ， 如 货币 的 供应 量 、 物 价 指数 等 名 。 因 此 ， 对 非 平稳 时 间 序 列 的 变 点 研究 有 很 
重要 的 实际 意义 。 值 得 注意 的 是 单位 根 过 程 是 常见 的 非 平稳 过 程 ， 且 方差 无 穷 ， 在 金融 系统 工 
程 中 有 广泛 的 应 用 器 。 

研究 变 点 问题 的 方法 主要 有 极 大 似 然 方法 回 、 最 小 二 乘 方法 四、 累积 和 方法 四 等 。 小 波 变 
换 具 有 自动 改变 窗 长 的 功能 ， 可 以 很 好 地 把 信号 在 空间 和 频率 上 局 部 化 ， 这 一 特性 使 其 成 
为 变 点 分 析 中 有 力 的 数学 工具 。Wangll 基于 小 波 系数 的 绝对 值 对 含 噪声 信号 的 变 点 进行 检 
验 ，Odgen 和 Parzenti9 利用 小 波 系数 的 累积 和 对 变 点 进行 检验 ，Raimondo Ñ Tajvidill) 应 用 
广义 Pareto 分 布 对 小 波 系数 进行 建 模 ， 解 决 了 方差 有 穷 的 厚 尾 信号 的 变 点 检验 问题 。 

本 文 研究 误差 项 为 单位 根 过 程 的 非 参数 回归 模型 均值 变 点 的 检测 问题 。 第 2 节 给 出 本 文 要 
研究 的 问题 。 第 3 节 介绍 小 波 变换 并 对 了 曲 声 的 小 波 系 数 进行 建 模 。 第 4 节 是 本 文 的 主要 研究 成 
果 。 最 后 用 模拟 研究 说 明 方 法 的 有 效 性 。 
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2 本文 研究 的 问题 


考虑 如 下 模型 
Y; = f(i/T) +6, i=1,---,T, (1) 

He, i=1,--- ;下 是 单位 根 序列 Ei = G1 + Uis 函数 及 ui 分 别 满足 以 下 假设 : 

假设 1 f(r) 为 未 知 非 参数 回归 函数 ， 变 点 个 数 、 位 置 及 跳跃 度 都 是 未 知 的 ， 而 变 点 个 数 
的 上 限 m 是 已 知 的 。 

假设 2 wi = yp(L)e; = D1PjEij? 其 中 {yj} 满足 raw a < oo, {e;,i = 1,2,---} 是 独 
立 同 分 布 随 机 变量 序列 ， 满 足 E(e;) =0, D(ei) = 0? < oo。 

本 文 研究 如 下 假设 检验 问题 : 

Ho: f 是 光滑 函数 (在 区 间 [0,1] 上 至 少 连续 可 微 ); 

Hm): 了 至 少 有 1 个 ， 最 多 有 由 个 跳跃 点 ， 除 此 以 外 ， 上 是 光滑 的 。 


3 小波 变换 与 中 心 极限 定理 


3.1 小波 变换 的 正则 性 
Syu) 是 一 个 小 波 母 函数 ， 通 过 伸缩 和 平移 变换 ， 得 到 一 列 小 波 基 函 数 


pje(u) = H Pphu- k), jeN, kez. 
函数 f 的 连续 小 波 变 换 如 下 
J sda TEN kez. 


当 给 定 离散 数据 集 Y = (Yi, , Yr) 时， 可 利用 与 连续 小 波 变 换 相 对 应 的 离散 小 波 变 换 得 
BY 的 经 验 小 波 系数 

W; k = Wk(f) +w; ple). (2) 
考虑 到 经 验 小 波 的 52- 范 数 后 ，Hirdle 8 ANI 用 以 下 和 式 来 近似 连续 小 波 变换 的 积分 式 


De ee Thee ot 
wil f) = JT 2, Vir/ T/T), w; ple) = Vi > Wijk t/T )e. (3) 


Mallat”? 提出 的 塔 型 算法 可 快速 计算 上 述 离散 小 波 变换 
(wx) = WY, 


其 中 W 是 依赖 于 小 波 基 的 一 个 正 交 矩阵 ， 指 标 ; 被 称 为 多 分 辨 水 平 (对 应 着 频率 w = 2-4), 
满足 0 < 7 < J 且 27+!1 = T。 指 标 k = 0,1,… ,2i 一 1 称 为 时 间 (空间 ) 参 数 (对 应 着 时 间 位 
@t=k/2’). 

XY PRK f LET RAE HR SB A Dk RBA on PAE AO 

1) 在 原 假设 Ho F, f 是 可 微 的 ， 对 所 有 的 分 辩 水 平 了 > jo = 3 以 及 所 有 的 大 = 
0 1 ,27 一 1， 有 hwi .(f)| < aT). 

2) 在 备 择 假设 机 下 ， 若 存在 一 个 点 z_ E [k/2i,(k 十 1)/2;) 并 且 z 是 了 的 跳跃 点 ， 则 
有 hw .(f)| > €(T274) 2» 
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常数 c1, co 仅仅 依赖 于 函数 /， 不 会 影响 检验 统计 量 的 设 定 及 检验 结果 ， 为 叙述 方便 ， 本 文 
假设 cl = ca = Le 以 上 两 条 性 质 表 明 ， 使 得 小 波 系数 wjx(7) 的 绝对 信 达 到 最 大 的 点 正好 对 应 
3.2 小 波 变换 与 中 心 极限 定理 
Donoho 和 Johnstone!’ 用 全 局 小 波 阔 值 对 小 波 系 数 进 行 压缩 以 达到 函数 去 噪 的 目的 ， 自 此 
中 心 极 限定 理 在 小 波 统计 建 模 中 得 到 广泛 的 应 用 ， 见 Hardle 等 83。 本 节 以 Haar 小 波 为 例 说 明 
极限 定理 在 非 平稳 厚 尾 时 间 序 列 的 小 波 系数 统计 建 模 中 的 应 用 。 
Haar 小 波 定 义 为 
W(x) = To,1y2) (£) — IH1y2,11(2), 
FEE hyn (x) 的 支撑 是 二 进 区 间 到 = [k/27, (E+1)/27)， 且 在 此 区 间 中 iT 的 个 数 为 了 /27， 
因此 有 i ni 
A = 一 -一 j/2 i 
wy 1 (€) VP 2 2? (t)e TT 3 €i, (4) 
DER ei 服从 单位 根 过 程 ， 方 差 无 穷 ， 故 利用 以 下 结果 对 噪声 的 小 波 系数 进行 建 模 [gl 。 
引 理 1 设 平稳 过 程 {wi} 满足 假设 2, $ & = utut tu, i 二 1,2,…,T。 车 &0 =0， 
那么 
T-3/257 1 Ww dr ~ N(0, pajos 
Lair > op() | We)dr ~ N(0, $v(1)e?), 


其 中 p(1) = eT OPie 
为 叙述 方便 ， 在 给 定 的 多 分 辩 水 平 ? 上 ， 令 


Wyk = Tate 
i T T 
wis) = aaya D DIT) walo = paag LVAD — ©) 
由 引 理 1 可 得 ， 当 了 /27 — co 时 ， 


1 
W;,K(€) = a(t) f W(r)dr ~ n(o, 50(1)0?). (6) 


4 主要 结果 


4.1 检验 统计 量 的 构造 

本 节 旨 在 构造 检验 统计 量 并 确定 小 波 系数 的 益 值 。 由 节 3.1 中 经 验 小 波 系数 的 基本 性 质 可 得 
如 下 定理 。 

定理 1 CAKE GE, X jwe BET HER Gl lwa > lwg) > > luz aay) Sor = 
2-327 -1/2, Fe BURR Ho 成 立时 ， 若 多 分 辨 水 平 j = jT) WE 





21 > (cr): 1<5<2, (7) 


P(|wj,ml > vr) — 1. (8) 
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关系 式 ar > br 表示 ， 对 于 充分 大 的 T， 存 在 正常 数 di Md: EE dibr < ar < d2br 成 立 。 
证 明 只 考虑 mm = 1 的 情况 ，m > 工时 类 似 处 理 。 我 们 证 明 在 多 分 辩 水 平 7 下 ， 当 了 一 > 
oo 时 
P(|w;,a)| < vr) — 0. (9) 


在 原 假 设 成 立时 ， 由 性 质 1) 可 知 
jos DN = [raphael] < gy 0r) = or. 
因此 hwjx| > [wle 一 vr， 从 而 
P( [wim] > vr) > P(l wim) (©) > 207) = 1— P( lwj (| < 27), 
而 
P(|w;,ay(€)| < 2ur) = P(max|w;,(e)] < 2vr) 
2v 


T 
lim dz, 
ee Pr. z 


EH p(x) ENO, ieo(l)c2) 的 密度 函数 。 而 当 多 分 辩 水 平 满足 条 件 (7) 时，wr = 27T 一 
o(T = oo)， 所 以 有 P(jw; ím)! < vr) 一 0, tH P(w; m)l > vr) ~ 1. 
考虑 如 下 检验 统计 量 


N; = lw; cay 一 [wim+ Dl 1 = 1,2,.… m. (10) 


在 原 假设 Ho 成 立时 ， 由 定理 1 可 得 ，N; < lw) ~ vr, i= 1,2,- m 是 依 概 率 1 成 立 的 ， 
此 定理 1 可 用 来 得 到 N 的 临界 值 ， 即 如 下 定理 2。 


定理 2 20<6<1 
o Jo j B 
= 3 o Oe Ge gn ae ijn" (11) 


Rr(B) = Ui-=l2…m{Ni > li}, 
在 原 假设 Po 成 立 下 ， 若 多 分 辩 水 平 了 满足 (7) 式 ， 则 


„im P{Rr(B)} < B. (12) 


< P(lwxk(e)| < 2vr) = 


证 明 & Mr = {wm | > vr}, 则 有 
P(N; > zx|Mr) < P(w — Vr >a|Mr), 4=1,2,--- m. 


AS DH BB wal > lwy gery) > … 二 um 在 没有 排序 之 前 为 jji lwjitih ,hwzmj， 则 
有 
P(\w;@|-vr >z | Mr) = P( max |w,;,%|—vr > | Mr) 
k=i,---,m 


< XO P(lwy.e! -vr > z | Mr). 
k=i 
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由 定理 1， 有 
P(|wj4|-—vr > z | Mr) = P( |w;,x| — vr > x) < P(|w;,n(€) [> 2). 


由 正 态 分 布 的 尾 概率 估计 公式 可 知 





r vet exp { - aaah 
所 以 


P(N; >a|Mr)< 





eV EO) op {- 3a? \, 4=1,2,--- ,m. 


2c2p(1) 


alm 
r=, WAT — woh BRD 


P(Rr(8)) < XC P(N; > £| Mr) 


i=1 
2 m(m—i+1) B 


< SES SB. (13) 
V27 -2log gab. Tit Um 


定理 证 毕 。 

注 1 如 果 所 讨论 模型 的 噪声 项 具有 尺度 因子 入 > 0, RY, = fG/T)+Aqa, i=1,---,T, 
则 (11) 式 中 的 临界 值 应 为 和 li。 由 定理 的 证 明 可 得 ， 临 界 值 二 实际 上 是 由 ws(e) 的 分 布 决定 
的 ， 也 即 噪声 的 不 同 将 导致 不 同 的 临界 值 。 

注 2 关于 多 分 辨 水平 ; 的 选 定 可 以 比较 各 个 多 分 辩 水 平 上 的 max, |wj,x| 与 


Tô- 1 
r = AV o T 1/2? 

当 函 数 不 含 变 点 时 maxk |wjk| < Cr, S4RRAARAN, max, |wjx| > Cr (可 参见 文 
献 [9])。 这 里 5 是 大 于 1 小 于 2 的 常数 。 

由 定理 1 和 定理 2 可 得 如 下 检验 步骤 : 

BRL 选 定 多 分 辩 水 平 7， 对 数据 做 离散 小 波 变换 得 到 经 验 小 波 系数 ， 并 进行 排序 wal 
> lwil > > wje 

步骤 2 FN, = hwl- lwm) i = 2,… ,m。 当 检验 统计 量 N < 五 时 ， 接 收 原 假 
设 ， 即 函数 了 为 光滑 函数 ， 若 Ni > li， 则 进行 下 一 步 。 

步骤 3 比较 Ni 与 5, i=2, ,m， 若 存在 常数 p 使 得 Np > lp E Npr Slp psm, W 
认为 函数 含有 p 个 变 点 。 

车 由 以 上 步骤 已 知 函数 含有 p 个 变 点 ， 则 C = lp + wy (mir) 为 本 文选 定 的 小 波 系数 阔 值 ， 
即 大 于 此 闹 值 的 小 波 系 数 对 应 着 函数 的 跳跃 点 。 

4.2 ”检验 的 一 致 性 

本 节 研 究 在 备 择 假设 Hi 成 立时 ， 变 点 检验 的 一 致 性 。 

定理 3 令 RTO 是 定理 2 所 定义 ， 在 备 择 假 设 Hi(m) 成 立时 ， 若 多 分 辨 水平 ; 满 足 (7) 式 ， 
则 

rim P{Rr(8)} =1. (14) 
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证 明 只 考虑 m = 1 的 情形 ，m > 1 类 似 可 得 。 令 


B ={ max Ws ei< } 
F ame | jk ( )| 人 TTI, 


其 中 


1 1 
rp = TY, ee ae 


ERAESRAR AL) FE, FEAR k. WE w > ITA, 4k A 
ky Bt, |wya(f)| < (2-9)8 771/229, BLL (7) RATS 


了 T 
esas Z lesan A hom (ON 2 hsm Dar > Ee (14+ Gen) 





log 
pusal < luya PN + basal < los P+ or < SED” + op = Ole), kx ht 


对 充分 大 的 了 ， 有 


õi 6-1 


T Tr 
jw; = max [wel = [wn|> — (1+0 ; 
pol = max lusa] = losinl > oe Gan) 


ERA jl， 使 得 |w;,(2)| = lws ATEA 


Ni = |w5,y| — lwl > ani + Geant): 
因此 若 证 明 ， 当 了 — o0 时 
P(Br) — 1, (15) 
则 可 得 Ni © oo， 也 即 定 理 成 立 。 由 于 当 j 满 足 (7) 式 时 ， 


25-1 
P(B$) = ia lu 对 > er) < > P(lwjlel > zz] 
of 2 x ZV PH) 。 xp { - 327? } 
Fe Saer 207¢p(1) 


3T?” 
C 了 6 一 也 1 一 0 hs, S 
x (log T) exp { 320250) \ 一 0， (16) 


lA 





(I 


所 以 当 T 一 off, P(Br)— 1， 从 而 Ni 2+ co。 定 理 证 毕 。 

43 变 点 位 置 的 估计 及 收敛 速度 

令 记 为 函数 的 变 点 个 数 ， 变 点 位 置 依次 为 0 < h < b < .<b liac 
m, Wi = sup(i :1<i<mT> c) ky < kg <- < 应 为 ju , lw; 全 | 在 来 
HEF POM GREK, ADR wpa] > Jwz] > … > lw; S (Â, 6 ,6) = 
(k1/2?, ka/27，.… ,三 /27)。 由 定理 3 可 得 如 下 推论 。 

推论 1 在 定理 3 的 条 件 下 ， ds 有 


P(i= ix) ,6 ~ 0)? = Op(27”). 


i=l 


由 推论 1 及 (7) TA, 6; — 0; = O(2-F) = O(T (log T)*), BU BGR KE T- (log T). 
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5 ”模拟 研究 

本 节 用 两 个 例子 来 说 明 小 波 在 变 点 检测 中 的 应 用 。 

例 1 考虑 无 变 点 的 模型 

Y; = f(i/T) + Ae, i1=1,2,--- ,T, 

其 中 f(x) X Heavisine MAX, BU f(x) = 4sin(4rz)， 见 图 1(a)。 图 1(b) 是 噪声 过 程 为 6 = 
Ei_1 + Ui, u; ~ N(0,1), i= 1,2,- THY Hea, 其 中 入 = 0.25. 

取样 本 容量 了 = 210， 小 波 函 数 为 Haar 小 波 ，m = 3， 检 验 水 平 为 = 0.05， 取 6 = 1.3, 
由 注 2 选 定 多 分 辩 水 平 7 = 5， 在 此 水 平 上 对 图 1(b) 中 的 区 进行 小 波 分 解 ， 得 到 的 结果 为 
图 1(c)。 由 图 可 知 ， 所 有 的 小 波 系数 都 小 于 本 文 给 出 的 阔 值 ， 即 检验 的 结果 是 接受 原 假 设 : R 
数 /为 光滑 函数 。 











ee 








1 1 
b o _N = o 一 N w A 
T 











“uty ul lle 


(b) (c) 
(b) Y; = f(i/T) + re, A = 0.25, éi, i=1,2 Te = 











图 1: (a) f(x) = 4sin(4rz)， 
et 十 Wi ui ~ N(0,1),¢=1,2,--- ,7, 


例 2 考虑 含有 两 个 变 点 的 模型 
Y; = f(i/T) + rei, #=1,2,--- ,T, 
其 中 f(z) 为 含 变 点 的 Heavisine HA, Bl f(x) = 9sin(4rx) —4.5sign(x—0.3) —4sign(0.58—z), 
见 图 2(a)。 图 2(b) 是 噪声 过 程 为 e = eii +u u ~ N(0,1), i=1,2,---, THY Wear, 
其 中 入 = 0.25。 
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取样 本 容量 = 210， 小 波 函 数 为 Haar 小 波 ，m = 5， 检 验 水 平 为 6 = 0.05。 取 5 = 1.3， 
由 注 2 可 得 只 有 多 分 辩 水 平 7 = 5 时 才 满 足 要 求 ， 在 些 水平 上 对 图 2(b) 中 的 殉 进 行 小 波 分 
解 ， 得 到 的 结果 为 图 2(c)。 从 图 中 可 以 看 出 ， 仅 有 两 个 小 波 系数 都 大 于 本 文 给 出 的 闪 值 ， 
即 检验 的 结果 是 接受 两 个 变 点 的 备 择 假设 ， 与 原 函 数 吻合 。 同 时 可 得 到 变 点 位 置 的 估计 
{4 6, = 0.3022 #16, = 0.5906. 
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图 2: (a) f(x) = 9sin(4rz) — 4.5sign(x — 0.3) — 4sign(0.58— z), (b) Yi = f(ü/T) + Aci, A = 0.25, 
€i, i= 1,2, TH Ei = G&-1t+Wi, Ui ~ N(0,1), i= 1,2,--- ,T, (c) 小 波 系 数 ， j = 5, (-) 线 
表示 本 文 的 国 值 


由 以 上 两 个 例子 我 们 可 以 看 出 ， 利 用 本 文 的 方法 ， 可 以 正确 判断 出 变 点 的 个 数 并 准确 的 估 
计 变 点 发 生 的 时 刻 。 
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Detecting Change-points in Mean of Nonparametric Regression 
Models with Unit-root Errors 
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Abstract: Based on the theory of multi-resolution analysis, the change-points in data can be detected 
by checking the absolute value of wavelet coefficients. In this paper, we combine wavelet methods 
and the extreme value theory to establish an approach to test the presence of an arbitrary number 
of discontinuities for an unknown function, based on date observed with unit-root noise. If the null 
hypothesis holds, we obtain critical values at any scale and prove the consistency of wavelet detection. 
If the alternative hypothesis holds, we show that the estimation of the numbers and location of change 
points are consistent. Simulation study supports our method. 

Keywords: change-point; unit-root process; wavelet transformation; the rate of convergence 
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